import pandas as pd
import os
from glob import glob


def determine_company_type(scope):
    """根据经营范围判断企业角色"""
    if pd.isna(scope):
        return '未知'
    scope = str(scope).lower()
    # 第一类企业
    # keyword1 = {
    #     '农资经销商': ['供销', '贸易', '商贸', '商场', '商超', '超市', '门市', '店', '站', '部', '栈', '摊', '点',
    #                    '合作社', '服务社', '经销', '批发', '零售','代购', '购销', '采购', '配送', '医院', '经营', '加盟', '资料', '中心', '直销', '商行', '销售',
    #                    '农资社', '粮行', '工作室','铺', '种子行', '冷库', '农贸社', '档', '菜种行', '日杂行', '商城', '联社', '办事处', '服务处',
    #                    '团购', '联盟', '直营', '专卖','总销处', '营销', '合作社']
    # }
    # # 第二类经营范围
    keywords = {
        # '农资经销商': ['农药零售', '化肥销售', '农用薄膜销售', '渔业专业机械的销售','农机具的销售','农药批发','肥料销售','农药销售'],
        # 其他类型
        # '种植大户': ['稻谷种植', '玉米种植', '蔬菜种植', '油料种植', '苗木种植', '稻谷的种植', '玉米的种植',
        #              '蔬菜的种植', '油料的种植', '苗木的种植', '中药材种植', '中药材的种植', '食用菌种植',
        #              '食用菌的种植', '园艺产品种植', '园艺产品的种植', '薯类种植', '薯类的种植', '草种植', '草的种植',
        #              '树木种植', '树木的种植', '水果种植', '水果的种植', '茶叶的种植', '花卉的种植', '茶叶种植',
        #              '花卉种植', '谷物的种植', '谷物种植', '豆类种植', '油料种植', '豆类的种植', '油料的种植',
        #              '棉花的种植', '棉花种植', '糖料作物种植', '糖料作物的种植', '坚果种植', '含油果种植',
        #              '香料作物种植', '中草药种植', '坚果的种植', '含油果的种植', '香料作物的种植', '中草药的种植']
        # '农资经销商': ['农药零售', '化肥销售', '农用薄膜销售', '渔业专业机械的销售','农机具的销售','农药批发','肥料销售','农药销售'],
        # 生产企业类型
        #         '农药生产企业': ['农药生产', '制造、销售农药原药、制剂', '农药加工', '农药研发', '农药制造', '甲拌磷乳油生产',
        #                          '农药制剂制造', '环已氧基乙酸烯丙酯生产', '农药复配加工', '微生物杀菌剂制造', '三嗪酮生产',
        #                          '80%代森锌可湿性粉剂加工', '生产农药', '农药中间体生产', '制造生物农药', '微生物农药研制',
        #                          '敌敌畏乳油制造', '农药的生产', '农药分装', '乳油加工', '加工农药', '制造农药', '研发农药',
        #                          '农药技术研发', '生产、销售：农药', '制造生物农药', '制造化学农药'],
        #         '肥料生产企业': ['有机肥的研发', '氨基酸（叶面肥）的研究', '肥料的复混加工', '微生物肥料研发', '肥料生产',
        #                          '肥料制造', '微生物肥料的制造', '化肥生产', '化肥制造', '化肥研发', '肥料的生产', '肥料的制造',
        #                          '肥料的研发', '化肥的生产', '化肥的制造', '化肥的价加工', '化肥的研发', '化肥加工', '肥料研发',
        #                          '复混肥生产', '中微量元素及功能肥料开发生产', '化工产品（危险品除外）生产', '磷酸二氢钾生产',
        #                          '肥料加工销售', '钙肥生产', '肥料的加工', '钾肥的生产销售', 'BB肥生产', '生物双效化肥制造',
        #                          '微肥的研发', '含氨基酸水溶肥料的生产与销售', '复合微生物肥料研发', '生物有机肥料研发',
        #                          '生物基材料技术研发', '生物化工产品技术研发', '硅肥料研发', '土壤与肥料的复混加工',
        #                          '植物抗逆剂研发', '植物生长调节剂生产'],
        #         '农业机械生产企业': ['农业机械制造', '农林牧渔专用仪器仪表制造', '农林牧副渔业专业机械的安装',
        #                              '农林牧副渔业专业机械的维修', '农业机械生产', '农机装备生产', '农机装备制造',
        #                              '农机装备加工', '农业机械配件加工', '滴灌设备生产', '滴灌设备加工', '滴灌设备制造',
        #                              '滴灌设备研发'],
        #         '种子生产企业': ['林木种子生产', '农作物种子生产', '食用菌菌种生产', '种子培育', '花草种子培育', '小麦种子生产',
        #                          '种子生产', '大豆种子的生产', '农作物种苗培育', '非主要农作物种子生产', '种苗培育'],
        # 经销商类型
                '农资经销商': ['经销：农资', '销售：农资', '经销：农膜', '农用薄膜销售'],
                '农药经销商': ['经销：农药','农药批发','农药零售','销售：农药','农药、化肥','农药.化肥'],
                '肥料经销商': ['经销：化肥','化肥销售','肥料销售','销售：肥料','销售：化肥','化肥、农药','化肥、种子','肥料、农药','化肥、农业机械及配件','零售：化肥'],
                '农业机械经销商': ['农业机械销售','经销：农机具','经销：农业机械','农、林、牧、副、渔业专业机械的销售'],
                '种子经销商': ['农作物种子经营','经销：种子','销售：种子','农作物种子','农作物常规种子','零售：不再分装玉米种子','零售：不再分装的农作物包装种子'],
                # 合作社类型
        '种植合作社': ['蔬菜种植', '农作物种植', '水果种植', '蔬菜的种植', '果品种植', '水果的种植', '果蔬种植',
                       '草莓种植', '葡萄种植', '食用菌种植', '农产品的种植',
                       '种植花卉', '果树种植', '瓜果种植', '经济作物种植', '中草药种植', '苗木种植', '黄桃种植',
                       '茶叶种植', '谷物种植', '豆类种植', '粮食种植', '果蔬栽种',
                       '油料种植', '薯类种植', '棉花种植', '中药材种植', '水稻种植', '牡丹种植', '小麦种植', '油菜种植',
                       '果林种植', '瓜蒌种植', '玉米种植', '水生植物种植',
                       '树木种植', '果蔬花木种植', '果园培育及种植', '果园种植', '樱花种植', '种植葡萄', '园艺产品种植',
                       '原材料种植', '花生种植', '稻谷产品的种植', '小麦产品的种植',
                       '种植的豆类', '番茄种植', '优质稻种植', '烟草种植', '坚果种植', '含油果种植',
                       '麻类作物种植（不含大麻）', '咖啡豆种植', '草种植', '香料作物种植', '可可豆种植',
                       '石斛种植', '竹种植', '金花茶人工培植', '苗圃的种植', '花卉培育、种植', '种植茶叶', '草坪种植',
                       '茶树种植', '糖料作物种植', '种植水稻', '稻谷种植', '粮油种植',
                       '藕种植', '香葱种植', '小麦良种培育种植', '农作物培育、种植', '园林观赏花木种植', '花卉种植',
                       '蔬果种植', '农作物栽培', '花木种植', '白茶种植', '白姜种植', '百合种植',
                       '板栗种植', '荸荠种植', '农产品种植', '油茶种植',
                       '果木种植', '药材种植', '中药材（不含国家禁止药材）种植', '蚕豆种植', '草坪的种植', '油桃种植',
                       '油料作物种植', '桃树种植', '青贮饲料种植', '薯类作物种植',
                       '农作物联合种植', '苗木、种植', '杂粮种植', '紫薯种植', '林木的种植', '农副产品种植',
                       '农作物的种植', '鲜花栽培、种植', '农作物良种推广种植', '葡萄苗种植',
                       '林木种植', '蓝莓种植', '粮食作物种植', '盆景种植', '蔬果的种植', '菊花种植', '红薯种植',
                       '萝卜种植', '农产物种植', '农作物销售与种植', '菌类种植', '林业种植',
                       '苗木培育、种植', '小麦及其他作物种植', '西瓜种植', '林木草花种子种植', '瓜蒌育苗、种植',
                       '高效农业种植', '树苗种植', '种植苗木', '种植农作物', '盆景培育、种植',
                       '红薯生产、种植', '稻米种植', '草莓的种植', '草莓种植', '中药材（不含专项）种植', '种植优质水稻',
                       '西瓜种苗、育苗、种植', '莲子、莲藕的储藏、初加工、销售及种植',
                       '农作物（水稻、棉花、大豆、西瓜、莲藕、蔬菜）种植', '草坪生产种植', '蚕桑种植', '农业种植',
                       '西瓜嫁接、育苗', '葡萄栽培', '木瓜种植', '杂粮种植', '苗木繁育、种植',
                       '芝麻种植', '猕猴桃种植', '中药材（不含许可项）种植', '中草药（不含许可项）种植', '果桑种植',
                       '长寿菜种植', '水稻的种植', '大葱种植', '早籼稻种植', '大棚种植', '种植花草',
                       '南瓜种植', '石榴种植', '丝瓜种植', '蔬菜培植', '苗木栽培', '盆景种植', '土豆种植',
                       '供应成员种植', '核桃种植', '农产品收购、种植', '马铃薯种植', '农林作物的种植',
                       '花卉开发、投资、种植', '种植瓜果蔬菜', '组织成员种植', '种植蔬菜', '花卉栽种', '南瓜种植',
                       '水生作物种植', '耦种植', '芹芽种植', '荸荠种植', '茨菇种植', '菱角种植',
                       '苗木花卉、种植', '核桃种植', '毛竹种植', '中药材种植', '茶叶种植', '蕨菜种植', '油茶果种植',
                       '野菜种植', '竹笋种植', '城镇绿化苗种植', '农作物（粮食作物、经济作物）种植',
                       '绞股蓝种植', '大叶青种植', '非洲香种植', '铁皮石斛种植', '辣木种植', '南非叶种植',
                       '农作物（水稻、小麦、油菜）种植', '玉米种植', '山芋种植', '香椿种植', '多肉植物种植',
                       '供应成员从事种植', '葛根种植', '香花菜种植', '黄蜀葵种植', '城镇绿化苗种植', '销售成员种植',
                       '经济林种植', '稻麦种植', '芹芽种植', '玫瑰种植', '油菜籽种植', '种植业',
                       '玫瑰花种植', '辣椒种植',
                       '开展与种植', '苗木的种植', '农业作物的种植', '中药材的种植',
                       '农作物订单种植', '为本社成员提供林木种苗种植', '花卉等种植', '为本社成员提供与种植 ',
                       '水蜜桃种植', '为本社成员提供种植', '统一供应本社成员种植', '兰花种植', '紫薇种植',
                       '土特产种植 ', '黄花菜种植', '百花菜种植', '韭菜种植', '城镇绿化苗的种植',
                       '金银花种植', '为本社成员提供有关种植', '茶业种植', '为本社成员提供与种植',
                       '瓜果的种植', '蘑菇种植', '樱桃种植', '新品种种植', '盆栽种植', '果木树种植',
                       '提供引进种植', '中药种植', '蔬菜销售及种植', '依法组织成员开展芡实种植', '果木树种植',
                       '组织成员养殖种植', '供应成员养殖种植', '提供与养殖种植', '组织成员养殖种植',
                       '供应成员养殖种植', '提供与养殖种植', '组织成员养殖种植', '供应成员养殖种植',
                       '提供与养殖种植', '提供与养种植', '蘑菇种植', '豆类的种植', '组织本社成员从事种植',
                       '组织本社成员从事蔬菜及蔬菜种苗的种植', '茶及其饮料作物的种植', '油菜的种植',
                       '小麦等谷类种植', '速生杨种植', '绿化植物种植', '苗圃种植', '山地杂果种植',
                       '苗圃种植', '农副产品的种植', '农副产品的种植', '农副产品的种植', '大樱桃种植',
                       '菌菇种植', '中药材的种植', '农作种植', '种苗种植', '果疏种植', '灵枣种植',
                       '灵枣种植', '花苗种植', '果木树种植', '贮藏成员种植', '并为成员提供种植',
                       '农副产品的种植', '谷类种植', '组织收购成员种植', '组织采购成员种植', '为成员提供种植',
                       '芦笋的种植', '花卉和绿化植物种植', '莲籽种植', '组织本社成员进行金银花种植',
                       '家禽种植', '苗圃种植', '山药种植', '销售及山药种植', '山药种植',
                       '组织成员进行金银花种植', '元胡种植', '无花果种植', '盆栽种植', '生姜的种植',
                       '鲜桃种植', '无花果种植',
                       '林木育苗', '培育各种苗木', '农作物（水稻、小麦、油菜、棉花、玉米、蔬菜）种植',
                       '农产品购销、种植', '瓜果种养殖', '农作物（水稻、小麦、油菜、玉米、经果林、水生植物）种植',
                       '茶叶初加工、种植', '农作物（水稻、小麦、玉米、蔬菜、水果）种植', '城镇绿化苗生产', '种植水果',
                       '农作物（水稻、小麦、油菜、药材）种植', '花草、苗木（不含种苗）培育', '种子培育、种植',
                       '国家种植', '盆景（盆栽）种植', '蘑菇制种。种植', '经果林育苗、种植', '草莓育苗、种植',
                       '种苗培育、种植', '水稻、种植', '草莓新品种培育、种植', '粮油作物种植', '玉米的种植',
                       '稻虾米种植', '瓜果蔬菜种苗培育、种植', '果树育苗、种植', '甜桃种植', '草莓培育、种植',
                       '花卉培育种植', ' 薯类的种植', '小麦的种植', '花果的种植', '粮食基地种植', '莲子种植',
                       '棉花的种植', '花卉的种植', '葛类种植', '青梅种植', '果业种植', '黄精种植',
                       '凤丹种植', '桑树种植', '丹皮种植', '竹苗种植', '香榧种植', '花茶种植', '野生种植',
                       '烟叶种植', '荷花种植', '吊瓜种植', '水稻种殖', '蔬菜生产种植', '大麦的种植',
                       '大麦种植', '莲子种植', '榆树种植', '毛桃种植', '栝楼种植', '葡萄的种植',
                       '圣桃的种植', '粮食的种植', '甘蔗的种植', '大豆的种植', '棉花的种植', '种植的棉花',
                       '种植优质棉', '花卉栽培、种植', '种植、销售水稻', '水稻种殖', '种植稻', '龙脑樟种植',
                       '种植莲藕', '种植的莲藕', '种植树木', '种植成品的莲藕', '种植、销售水稻',
                       '种植、销售苗木花卉', '种植精品苗木花卉', '种植魔芋', '竹木种植', '黄茶种植',
                       '白茶种植', '绿茶种植', '芡实种植', '荸荠的种植', '中药草的种植',
                       '中草药（国家限制经营的除外）的种植', '经济林木育种、种植', '花卉培育种植', '水稻等种植',
                       '种植荸荠', '火龙果种植', '小麦育苗育秧', '苗木花卉培育种植', '树木的种植',
                       '果蔬的种植', '果的种植', '牧草、种植', '甜叶菊种植', '大豆的种植', '花生的种植',
                       '银杏树的种植', '谷物的种植', '瓜蒌籽加工', '薯种及种植', '紫薯种植', '大白桃的种植',
                       '果树的种植', '高粱的种植', '豆类作物种植', '草的种植', '甜叶菊种植', '黄豆种植',
                       '水果生产种植', '水果栽培', '小麦、种植', '水稻生产', '玉米选种', '种植',
                       '农作物机械化种植', '开展种植'
                       ]
    }
    for category, keys in keywords.items():
        for key in keys:
            if key in scope:
                return category
    return '其他类型企业'


# 设置路径
input_dir = './data'  # 输入文件夹路径
output_dir = './out'  # 输出文件夹路径
os.makedirs(output_dir, exist_ok=True)

# 获取所有Excel文件
excel_files = glob(os.path.join(input_dir, '*.xlsx'))

for file_path in excel_files:
    # 读取文件，跳过首行，第二行为列名
    df = pd.read_excel(file_path, header=1)

    # 处理并添加新列（自动添加到最后一列）
    if '经营范围' in df.columns:
        df['企业角色'] = df['经营范围'].apply(determine_company_type)

        # 生成输出路径
        filename = os.path.basename(file_path)
        output_path = os.path.join(output_dir, f"processed3_{filename}")

        # 保存文件
        df.to_excel(output_path, index=False, engine='openpyxl')
        print(f"文件 {filename} 处理完成并保存为 {output_path}")
    else:
        print(f"文件 {os.path.basename(file_path)} 缺少'经营范围'列，已跳过")
        continue

print("所有文件处理完毕！")
